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Résumé 

Les outils de recherche d'information sur le web doivent tenir compte des 
phénomènes nouveaux liés à l'apparition des blogs, wikis, et autres publi- 
cations collaboratives. Parmi ces sites, l'encyclopédie Wikipédia constitue 
une source importante d'information. La qualité de ses informations a 
pourtant été récemment mise en cause. Mieux connaître les comporte- 
ments des contributeurs peut permettre de guider les utilisateurs dans 
des contenus de qualité parfois disparate. Pour explorer cette voie, nous 
présentons une analyse du rôle de différents types de contributeurs dans 
le contrôle de la publication d'articles conflictuels. 

Mots-clefs : Wikipédia, Fiabilité de l'information, Conflit, Travail colla- 
boratif. 

Abstract 

Online IR tools have to take into account new phenomena linked to the ap- 
pearance of blogs, wiki and other collaborative publications. Among thèse 
collaborative sites, Wikipédia represents a crucial source of information. 
However, the quality of this information has been recently questionned. A 
better knowledge of the contributors' behaviors should help users navigate 
through information whose quality may vary from one source to another. 
In order to explore this idea, we présent an analysis of the rôle of différent 
types of contributors in the control of the publication of conflictual arti- 
cles. 

Keywords: Wikipédia, Information reliability, Conflict, Collaborative 
work. 



1 Introduction 

De plus en plus présent dans les résultats des moteurs de recherche, le projet 
encyclopédique Wikipédia est devenu par les usages une ressource information- 
nelle de référence, et l'un des sites web les plus visibles et les plus controver- 
sés sur Internet. Très éloignée du modèle encyclopédique des Lumières, dans 
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lequel l'expert et sa signature garantissaient la qualité des textes, Wikipédia 
s'appuie sur cinq principes fondateur^ supposés garantir cette qualité : projet 
encyclopédique, neutralité de point de vue, contenu libre, règles de savoir-vivre, 
et, enfin, pas de règles fixes en dehors de ces principes. Ainsi, si les proces- 
sus d'édition sont loin de ceux de l'encyclopédie traditionnelle, les buts affi- 
chés de pertinence encyclopédique et d'objectivité en restent assez proches 
|Giles, 2005[ |Endrezzi, 20Ô7| . Néanmoins, la qualité de l'encyclopédie libre fait 
l'objet de débats : si |Giles, 2005| a constaté que la qualité de Wikipédia était 
finalement comparable à celle de l'encyclopédie Britannica, P. Assouline et ses 
étudiants |Gourdain et al, 2007| se sont attachés à montrer le contraire lorsqu'il 
s'agit des sciences humaines. 

Pour faire respecter ses principes fondateurs, la communauté wikipédienne a 
progressivement mis en place des outils formels ou informels de contrôle. Ainsi, 
aux articles sont parfois apposés des bandeaux spécifique^! évaluant les articles 
en fonction de leur respect, ou non, des principes fondateurs (par exemple ar- 
ticles de qualité par opposition à articles soupçonnés de non-pertinence ou ar- 
ticles non neutres). Les pages de discussion de ces articles conflictuels accueillent 
les arguments des contributeurs et médiateurs |Stvilia et al, 20 05 ]. Outre les 
bandeaux, un Comité d'arbitrage (CAr) a été mis en place pour régler les conflits 
personnels sévères entre contributeurs. Le CAr est un jury de sept arbitres is- 
sus de la communauté contributrice qui les élit pour une période de six mois. 
Les délibérations et les votes du CAr sont publics et cherchent autant que pos- 
sible l'unanimité. Les arbitres ne se prononcent pas sur le contenu ou la ligne 
éditoriale, mais s'en tiennent au principe fondamental de savoir-vivre (appelé 
aussi wikilove). Ils ont des possibilités de sanction qui peuvent aller du blocage 
(interdiction technique et temporaire de contribuer sur un ou plusieurs articles) 
au bannissement définitif (interdiction de participer à tout contenu de Wiki- 
pédia). Bien que relativement rare - seule une centaine d'utilisateurs sur les 
31 000 wikipédiens ont comparu devant le CAr en 5 ans -, l'arbitrage constitue 
un outil important de gouvernance de Wikipédia. C'est à travers ces outils, et 
les contributeurs qui les utilisent, que s'exerce le contrôle de la publication . 

Après une description du corpus utilisé, nous établirons une typologie des 
contributeurs suivant des paramètres qui reflètent leur implication dans les 
conflits et leur activité générale de publication et d'administration dans l'en- 
cyclopédie. Nous étudierons ensuite la répartition de ces types de contributeurs 
dans l'édition des articles signalés par la communauté wikipédienne comme par- 
ticulièrement conformes, ou au contraire non conformes, aux principes de perti- 
nence encyclopédique et d'objectivité. Nous conclurons sur les liens entre types 
de contributeur et conformité d'un article aux principes encyclopédiques. 



http://fr.wikipedia.org/wiki/Wikipédia:Principes_fondateurs 



L'articulation entre neutralité de point de vue et objectivité est réalisée ainsi : 
« Ce que les gens croient, voilà un fait objectif, et nous pouvons présenter cela as- 
sez facilement d'un point de vue neutre. » (Jimbo Wales, le fondateur de Wikipédia, 
http://fr. wikipédia. org/wiki/Wikipédia:Neutralité de point de vue). 
•' http://fr.wikipedia.Org/wiki/Categorie:Maintenance_des_articles 
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2 Corpus 

Wikipédia est un terme générique qui recouvre à la fois une initiative de créa- 
tion d'encyclopédie en lignqfl libre, collaborative et multilingue, et l'ensemble des 
instances de cette encyclopédie, distinctes géographiquement et souvent linguis- 
tiquement. Nous disposons de la sauvegarde réalisée le 2 avril 2006, regroupant 
tous les articles de Wikipédia- Franchi depuis ses débuts, soit plus de 600 000 
pages comprenant notamment près de 370 000 pages d'articles auxquelles sont 
associées plus de 40 000 pages de discussion sur article. Les corpus que nous étu- 
dions sont des pages extraites de cette base transformées en XML par Wiki2TeS 

Nous nous sommes particulièrement intéressés aux conflits entre wikipédiens 
|Auray et al., 2007} |Kittur et al., 2007| |Viégas et al, 20 04] car ils sont révéla- 
teurs de la manière dont le contrôle de la publication s'effectue. Le premier des 
corpus collectés comprend les 1000 articles de notre collection qui comportent 
ou ont comporté à un moment de leur évolution un bandeau de controverse de 
neutralité, ainsi que leur éventuelle page de discussion. Environ 1600 contribu- 
teurs apparaissent dans ces pages. Ces contributeurs, bien qu'en petit nombre, 
ont un poids important dans Wikipédia car ils ont participé à environ 300 000 
articles sur les 370 000 pages d'articles de notre collection, soit 81%. Dans les 
pages d'articles et de discussions, le balisage spécifique des informations consiste 
essentiellement à associer à chaque intervention sa taille, le nom de son auteur, 
et la date de son insertion. 

L'autre corpus est constitué des quatre-vingts pages d'arbitrages qui se sont 
tenus durant la période des débuts de Wikipédia-France à avril 2006. Le bali- 
sage de chaque page se répartit en rubriques qui répondent à la structure-type 
des arbitrages. On a ainsi une description du conflit, qui identifie le plaignant 
et la date de la plainte, le (ou les) accusé(s), la décision de recevabilité et la 
décision de jugement. Ensuite viennent les argumentaires des protagonistes, les 
discussions des arbitres sur la recevabilité de la plainte, et enfin le jugement 
proprement dit qui est composé d'une proposition de sanction et d'un vote 
des arbitres. Si l'unanimité ne peut se faire autour de la première proposition, 
d'autres propositions et votes peuvent suivre. 



3 Typologie des wikipédiens en conflit personnel 

Dans la centaine d'arbitrage de notre corpus, certains noms de contribu- 
teurs apparaissent plus souvent, soit dans le rôle du plaignant qui dépose la 
plainte, soit dans le rôle de l'accusé. Ces deux pôles, fréquence de comparution 
et rôle dans la plainte, nous permettent de dégager une première typologie des 
contributeurs en conflit. 

Nous avons distingué trois catégories de contributeurs suivant la fréquence 
de comparution, les très habitués qui cumulent entre 3 et 14 comparution^], les 

4 Consultable sur http://www.wikipedia.org/ 

5 Consultable sur http://fr.wikipedia.org/ 

6 Logiciel libre disponible sur http://wiki2tei.sourceforge.net/ et distribué conformément à 
la licence BSD (http://www.opensource.org/licenses/bsd-license.php). Il convertit les balises 
de mise en forme du wikitexte en balises XML et insère un en-tête descriptif du document 
conforme au modèle de la Text Encoding Initiative (TEI) 

7 14 est un record, on en a ensuite deux à 7 et un à 4, les autres étant à 3 comparutions. 
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habitués qui en ont deux, et les occasionnels qui ont une seule comparution. 
Quant à leur rôle dans la plainte, nous avons distingué les plaignants, qui sont 
plus souvent en position d'accusateurs, les accusés, qui ont plus de plaintes 
déposées contre eux qu'ils n'en déposent, et ceux qui comparaissent de façon 
assez équilibrée tantôt en plaignants tantôt en accusés. On voit sur le tableau Q] 
que les wikipédiens qui comparaissent souvent, les très habitués, sont en majorité 
plaignants, alors que les occasionnels, qui n'ont comparu qu'une fois, sont en 
majorité des accusés. On constate aussi que la majorité de ceux qui ont comparu 
deux fois ont été une fois plaignants, une fois accusés. 



Comparutions 


Contributeurs 


Plaignant 


Accusé 


Les 2 


Très habitués 


10 


50% 


30% 


20% 


Habitués 


17 


12% 


29% 


59% 


Occasionnels 


74 


30% 


70% 


0% 



Tab. 1 - Les comparutions au Comité d'arbitrage 



Nous avons ensuite introduit dans cette typologie le mode de contribution à 
Wikipedia. Ainsi, nous avons considéré le nombre d'interventions dans l'édition 
de l'ensemble des pages d'articles et de discussions de Wikipédia-France. Nous 
avons établi quatre catégories, les très gros contributeurs dont le nombre d'in- 
terventions varie entre environ 12 000 et 40 000 pendant la période considérée, 
les gros contributeurs, entre 2 800 et 12 000, les contributeurs moyens entre 600 
et 2 800, et les petits contributeurs, entre 1 et 600. Nous avons enfin distingué 
trois catégories de contribution suivant que celle-ci concernait plus souvent les 
articles, plus souvent les discussions, ou étaient répartis entre les deux. 



Contributions 


Contributeurs 


-> article 


-> discussion 


Les 2 


Très gros contributeurs 


7 


100% 


0% 


0% 


Gros contributeurs 


23 


96% 


0% 


4% 


Contributeurs moyens 


31 


81% 


0% 


19% 


Petits contributeurs 


40 


70% 


5% 


25% 



Tab. 2 - Les contributions des protagonistes du Comité d'arbitrage 



Le tableau [2] montre que les contributeurs en conflit personnel participent 
dans l'ensemble davantage à l'élaboration des articles qu'aux discussions qui les 
accompagnent. En revanche, on constate que moins ils contribuent aux articles, 
plus ils ont tendance à en discuter. En croisant la fréquence de comparution et 
la taille des interventions (tableau [3]) , on se rend compte que les très habitués 
du CAr sont en majorité des gros contributeurs, les occasionnels étant plutôt 
des petits contributeurs. En croisant la taille des contributions et le rôle dans 
la plainte (tableau , on constate que les gros contributeurs sont plus souvent 
plaignants et les petits contributeurs plus souvent accusés. La part des prota- 
gonistes qui sont, de façon comparable, tantôt plaignants, tantôt accusés, reste 
pour chaque groupe marginale. 

Ces tableaux nous suggèrent que les gros contributeurs à Wikipédia en ont 
bien intégré les principes fondamentaux, et tiennent à les faire respecter. En 
effet, la tendance qui émerge est que plus ils contribuent aux articles et plus ils 
jouent un rôle de contrôle de la publication parallèlement à leur participation 
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Comparutions 


Contributeurs 


très gros 


gros 


moyen 


petit 


Très habitués 


10 


20% 


50% 


30% 


0% 


Habitués 


17 


13% 


29% 


29% 


29% 


Occasionnels 


74 


4% 


18% 


31% 


47% 



Tab. 3 - Les types de contributeurs dans les comparutions 



Contributions 


Contributeurs 


Plaignants 


Accusés 


Les 2 


Très gros contributeurs 


7 


57% 


29% 


14% 


Gros contributeurs 


23 


39% 


44% 


17% 


Contributeurs moyens 


31 


32% 


58% 


10% 


Petits contributeurs 


40 


15% 


75% 


10% 



Tab. 4 - Rôle dans la plainte par taille de contribution 



|Bryant et al., 200*5] . Ce contrôle s'exerce dans le cadre du CAr par leur rôle plus 
intensif en tant que plaignant. Il s'exerce majoritairement vis-à-vis de moyens 
et petits contributeurs. 

4 Les contributeurs en conflit dans les articles 
non neutres 

En amont de l'arbitrage, le bandeau de controverse de neutralité constitue 
pour nous le premier indice tangible de désaccord entre wikipédiens. Nous avons 
observé que 77% des protagonistes du CAr figurent parmi les 1600 contributeurs 
à au moins un article non neutre. Cette forte présence suggère qu'une grande 
partie des conflits naît de controverses sur l'objectivité. Les très gros contribu- 
teurs et les très habitués du CAr figurent tous dans le corpus des articles non 
neutres, et les plaignants presque tous (90%), alors que les accusés y sont moins 
présents (73%). Ce sont les petits contributeurs présents au CAr qui participent 
le moins aux articles non neutres (57%). 

Pour donner une idée plus précise des types de comportements des wikipé- 
diens dans le processus de validation de l'information, nous étudions àprésent 
leurs participations à des articles couverts par un bandeau particulieo Nous 
avons utilisé ces bandeaux pour typer les articles en articles de qualité, articles 
en controverse de neutralité, articles en controverse de pertinence, et articles en 
protection. 

La figure [Tj représente, en courbe décroissante, le nombre de contributions 
respectivement aux articles sous protection (A), aux articles non neutres (B), 
aux articles en controverse de pertinence (C), et aux articles de qualité (D), des 
vingt contributeurs les plus prolifiques du corpus des articles non neutres. Sur 
ces graphes, les wikipédiens de statut particulier^ sont marqués d'un astérisque, 
et leur implication éventuelle dans un arbitrage est indiquée par une ligne ver- 

8 Défini dans Wikipédia comme étant « un type de cadre figurant dans les articles pour 
transmettre une information ou un lien ». 

9 Nous entendons par statut particulier une distinction spécifique de droits et de fonctions 
accordée à certains contributeurs volontaires élus par la communauté. On y retrouve les ad- 
ministrateurs, les arbitres, les wikipompiers, etc. 
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FiG. 1 - Types d'articles et contributeurs en conflit 



ticale proportionnelle au nombre d'arbitrages. On observe que parmi les vingt 
principaux contributeurs aux articles sous protection (|T|A.) , 35% ont comparu 
devant le CAr. Leur rôle lors de ces arbitrages est assez disparate, tantôt plai- 
gnants, tantôt accusés, habitués ou occasionnels devant le CAr. On note par 
contre qu'au sein des wikipédiens les plus prolixes dans les articles de qualité 
(jTjD) , trois seulement sont impliqués dans des arbitrages, toujours comme plai- 
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gnants. Toutefois, aucun d'eux n'est un habitué du CAr, ce qui tempère cette 
apparence d'agressivité. Entre ces deux tendances, les contributeurs aux articles 
non neutres et aux articles non pertinents montrent une tendance moyenne au 
conflit. En effet 25% des principaux contributeurs aux articles non neutres (fi- 
gure QJ3) et 20% des contributeurs les plus concernés par des articles non per- 
tinents (figure \VP) sont également protagonistes d'un arbitrage. Par ailleurs, 
il est remarquable que la majorité de ces gros contributeurs ont également un 
statut particulier. Cela confirme la corrélation déjà signalée entre l'implication 
forte d'un contributeur, tant par le nombre de contributions que par un statut 
particulier, et sa présence là où les principes fondateurs de Wikipédia ont be- 
soin d'être défendus. Il en découle une tendance au respect des règles de qualité 
wikipédiennes de l'information là où ces contributeurs interviennent. 

5 Conclusion 

En tant qu'espace collaboratif visant à concentrer et structurer des contenus 
encyclopédiques, Wikipédia est à l'origine de processus coopératifs, d'échange 
d'information et de désaccords. À la suite d'une étude des habitudes des wikipé- 
diens - tant à travers leurs contributions qu'au cours des controverses et conflits 
- nous avons dégagé des comportements de nature à guider d'autres utilisateurs 
et à accorder une certaine confiance à l'information. En effet, notre étude ex- 
ploratoire a montré une tendance des gros contributeurs impliqués dans l'ad- 
ministration de Wikipédia à s'investir pour faire respecter les règles du projet, 
notamment dans son principe qualitatif de neutralité de point de vue, quitte à 
demander un arbitrage si le comportement d'un contributeur n'est pas conforme 
au principe du wikilove. 

Principalement plaignants mais peu habitués du conflit, ces gros contribu- 
teurs semblent occuper une position de contrôle éditorial et qualitatif sur l'en- 
cyclopédie. En cela, la présence de tels wikipédiens parmi les contributeurs d'un 
article apporte une certaine fiabilité à l'information qui y a été déposée. En re- 
vanche, une forte concentration de contributeurs habitués des conflits personnels 
pourrait indiquer un article sujet à caution. Cette tendance demande cependant 
à être confirmée d'une part par une validation qualitative sur des articles non 
conflictuels, et d'autre part par un examen des mêmes classes de contributeurs 
dans d'autres instances de Wikipédia. 
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